花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。
搜索
如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。
刚刚,华为支持的开源 AI Agent 平台社区 openJiuwen 发布并开源了蜂群智能体 JiuwenSwarm。
今天,我们推出 Kimi WebBridge。 一个面向 Kimi Code、Claude Code、Cursor、Codex、Hermes Agent、OpenClaw 等本地 AI Agent 的浏览器插件,让 AI 真正像你一样操作浏览器。
Nacos 作为 Skill Registry AI Agent 进入日常工作流后,能力复用的载体正在发生变化。 过去,我们复用的是脚本、配置、模板和文档;现在,越来越多可复用经验会被沉淀成 Skil
最近,一家叫 CopilotKit 的公司宣布完成 2700 万美元的 A 轮融资,由 Glilot Capital、NfX 和 SignalFire 联合领投。这不只是一条融资新闻,它背后指向的是一个更大的问题:当 AI agent 已经可以真正嵌入应用、理解用户意图、生成动态界面、自主执行任务,我们今天所熟悉的软件交互方式,还能撑多久?
上次给大家分享了一个 CUA 的开源项目,能让 AI Agent 直接操控电脑界面,相当于把任何 App 都变成 Agent 的 Skill。反响还不错。
Snapchat 近日宣布,在其核心聊天功能中推出全新广告产品 AI Sponsored Snaps。这一产品是在原有 Sponsored Snaps 广告形式基础上的全新升级,广告主可以将自有 AI Agent 接入 Snapchat 聊天界面,与用户展开实时、个性化的深度交流互动。
一个开发者公开了自己的工作流:让 OpenAI Codex 专门去审查 Hermes agent 写出来的代码,理由只有一个——审稿人不能和写稿人共享同一套记忆。这条推文引发了近万次浏览,背后藏着一个 agent 工程化的新趋势:多模型协作的价值,可能在于互相制衡。
张佳圆带着他的新产品 Multica 一周斩获 GitHub 1.2w Star回来了。这一次,他想探索的是: 当 AI Agent 已经足够好,一个团队要怎么和多个 Agent 丝滑地协作?Multica 致敬的是 1964 年的操作系统 Multics——那个最终失败、但启发了 Unix 世界半个世纪的“多人、多任务”先驱。今天,它正在创造新的历史。
一直以来,我都觉得,对于 AI Agent 来说,最好的 Skill(技能)就是各种 APP。特别是在国内,大部分 APP 都是不那么 Open 的。不过最近,我发现了一个宝藏开源项目,可以解决这个问题。它叫 Turix CUA。